html-parsing

投稿关注

文章 0 浏览 6

在 Rails 中创建 HTML 段落的文本摘录

我正在尝试提取一篇文章的摘录（标记解析为 HTML），其中仅包含段落中的纯文本。所有 HTML 都需要被删除，换行符、制表符和连续空格需要替换为单个空…

月朦胧 2025-01-12 02:29:24 0 0

在bash Linux中获取count的值

我有如下字符串， || name: xzy || class: 9 || date: 07-01-2022 || marks:25 我只想检索标记 Ie 25 。所有字符串值都不断变化。名称、日期和标记是…

送君千里 2025-01-10 19:28:21 1 0

抓取数据时找不到标签

我是 Python 新手，一直在开发一个程序，该程序会在新商品上传到 jp.mercari.com（购物网站）时提醒您。我的程序的警报部分正在运行，但它是根据搜索…

垂暮老矣 2025-01-10 16:48:21 1 0

无法在 python 上使用 selenium 访问类中的文本

我愿意解析 https://2gis.kz ，并且我遇到了使用时出错的问题。文本或用于从类中提取文本的任何方法我正在输入搜索查询，例如“健身” 我的窗口变量…

不必你懂 2025-01-09 13:28:04 1 0

如何从文章网页中确定文章PDF下载链接？

我想从我的 DOI 列表中自动下载一些文章（大约 1500 篇）。使用 doi.org 我可以获得每个人的网站内容。但问题是每个网站都是独一无二的，我不知道如何…

玩套路吗 2025-01-09 13:24:31 1 0

Python - 如何通过多个Google网站搜索电子邮件地址

我正在尝试检索在网络上搜索的不同公司的一些电子邮件地址。我有一个包含公司名称的 Excel 文件，我想出了一个小脚本，可以在 Google 上并排搜索每…

染年凉城似染瑾 2025-01-09 02:12:39 2 0

如何使用 Jsoup 获取此文本？

如何使用 Jsoup 从以下 html 代码中获取“此文本”？ this text Other texts00:00 当我尝试 String s = doc…

比忠 2025-01-08 17:13:20 1 0

如何删除字符串中 HTML 标记中的所有 HTML 属性

我试图获取一个包含 HTML 的字符串，去掉一些标签（img、object）和所有其他 HTML 标签，去掉它们的属性。例如： Some Text Some Link Text 会变成： …

输什么也不输骨气 2025-01-08 06:27:05 1 0

尝试创建一个正则表达式来从java中的字符串中提取网站地址，但无法正确执行

我正在尝试使用以下代码从 url 中提取网站地址， public String getWebSiteAddress(String text) { Pattern p = Pattern.compile("\\b([a-z0-9]+(-[a-…

永不分离 2025-01-08 02:33:40 2 0

使用 PHP 的 DOM 实现返回第一个“n”； HTML 字符串的字符

给定一个 HTML 字符串，我想返回具有以下属性的修改后的字符串：文本内容的前 n 个字符（除了 HTML 标签）应保留。满足 n 个字符之后的元素应完全删…

清引 2025-01-07 13:28:12 1 0

如何找到
使用 Xerces-J 具有特定属性值的标签？

我在 Java 中使用 Xerces。我想解析 HTML 文档以查找具有特定属性（例如 id = myID）的 div 元素。找到所述元素后，我想返回 div 中的文本内容。我无…

三岁铭 2025-01-07 07:22:21 1 0

HTML 图像字符串解析器

我想知道是否有人对我的问题有任何想法。我需要从 UIWebView 加载的 html 文件中提取所有图像文件。我已将文件加载到 NSString 中，现在需要解析该文…

聊慰 2025-01-07 04:09:38 1 0

lxml 和 libxml2 哪个更适合在 Python 中解析格式错误的 html？

对于格式错误的 html，哪一个更好、更有用？我找不到如何使用 libxml2。谢谢。…

樱娆 2025-01-07 01:24:27 1 0

从 HTML 页面创建 CSV 文件

我从数据库中提取了记录并将它们存储在仅包含文本的 HTML 页面上。每条记录都存储在段落字段中，并由换行符和行 hr>. 例如： Company Name 555-555-…

别闹i 2025-01-06 23:28:18 1 0

JavaScript 中严格的 HTML 解析

在 Google Chrome (Canary) 上，似乎没有字符串可以使 DOM 解析器失败。我正在尝试解析一些 HTML，但如果 HTML 不完全、100% 有效，我希望它显示错误…

ζ澈沫 2025-01-06 18:10:07 1 0

共 54 页
1
2
3
4
5
下一页

关注

卷耳

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

℉服软

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

凉宸

文章 0 评论 0

关注

gyhjy

文章 0 评论 0

友情链接

文江博客

html-parsing

在 Rails 中创建 HTML 段落的文本摘录

在bash Linux中获取count的值

抓取数据时找不到标签

无法在 python 上使用 selenium 访问类中的文本

如何从文章网页中确定文章PDF下载链接？

Python - 如何通过多个Google网站搜索电子邮件地址

如何使用 Jsoup 获取此文本？

如何删除字符串中 HTML 标记中的所有 HTML 属性

尝试创建一个正则表达式来从java中的字符串中提取网站地址，但无法正确执行

使用 PHP 的 DOM 实现返回第一个“n”； HTML 字符串的字符

如何找到
使用 Xerces-J 具有特定属性值的标签？

HTML 图像字符串解析器

lxml 和 libxml2 哪个更适合在 Python 中解析格式错误的 html？

从 HTML 页面创建 CSV 文件

JavaScript 中严格的 HTML 解析

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接